ডেটা ভিজুয়ালাইজেশনের জন্য Box Plot, Histogram, এবং Scatter Plot

ডেটা ভিজুয়ালাইজেশন - পাইথন কৃত্রিম বুদ্ধিমত্তা (Artificial Intelligence with Python) - Machine Learning

371

ডেটা ভিজুয়ালাইজেশন হলো ডেটাকে গ্রাফিক্যাল ফরম্যাটে উপস্থাপন করার প্রক্রিয়া, যা ডেটার মধ্যে প্যাটার্ন, সম্পর্ক এবং প্রবণতা সহজে বোঝার জন্য সহায়ক। এখানে Box Plot, Histogram, এবং Scatter Plot এর ব্যবহার এবং তাদের গুরুত্ব আলোচনা করা হলো।


১. Box Plot

Box Plot (বা Box-and-Whisker Plot) ডেটার সারাংশ উপস্থাপনে ব্যবহৃত একটি চিত্র। এটি ডেটার স্কেল, মধ্যম মান (median), পার্সেন্টাইল (quartiles), এবং আউটলিয়ার (outliers) প্রদর্শন করে। এটি ডেটার বিতরণ, ভ্যারিয়েন্স এবং আউটলিয়ার চিহ্নিত করতে সাহায্য করে।

বৈশিষ্ট্য:

  • Minimum, Maximum, Quartiles (Q1, Q3) এবং Median (Q2) প্রদর্শন করে।
  • আউটলিয়ার বা অস্বাভাবিক মানগুলি চিহ্নিত করা হয় (যেগুলি বক্সের বাইরে থাকে)।
  • ডেটার ভ্যারিয়েন্স এবং স্প্রেড দেখতে সাহায্য করে।

ব্যবহার:

  • ডেটার বিতরণ এবং স্কিউনেস (skewness) বিশ্লেষণ করা।
  • আউটলিয়ার চিহ্নিত করা।

উদাহরণ:

import matplotlib.pyplot as plt
import numpy as np

# ডেটা তৈরি
data = np.random.normal(0, 1, 1000)

# Box Plot তৈরি
plt.boxplot(data)
plt.title('Box Plot')
plt.show()

২. Histogram

Histogram হলো একটি গ্রাফিক্যাল উপস্থাপনা যা ডেটার ভ্যালুগুলির ঘনত্ব বা frequency দেখায়। এটি ডেটার বিভিন্ন রেঞ্জে (bin) ভাগ করে এবং প্রতি রেঞ্জে কতটি ডেটা পয়েন্ট রয়েছে তা দেখায়।

বৈশিষ্ট্য:

  • ডেটার frequency distribution দেখায়।
  • Binning: ডেটাকে কিছু নির্দিষ্ট রেঞ্জ বা bin-এ ভাগ করে।
  • Skewness এবং Kurtosis বিশ্লেষণে সহায়তা করে।

ব্যবহার:

  • ডেটার বন্টন বিশ্লেষণ।
  • একক পরিবর্তনশীল ডেটার বিভিন্ন ধরণ (uniform, normal, skewed) চিহ্নিত করা।

উদাহরণ:

import matplotlib.pyplot as plt
import numpy as np

# ডেটা তৈরি
data = np.random.normal(0, 1, 1000)

# Histogram তৈরি
plt.hist(data, bins=30, edgecolor='black')
plt.title('Histogram')
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.show()

৩. Scatter Plot

Scatter Plot হলো দুটি ভেরিয়েবলের মধ্যে সম্পর্ক দেখানোর জন্য ব্যবহৃত একটি গ্রাফ। এতে দুটি ভেরিয়েবলের মানের মধ্যে সম্পর্ক (positive, negative, বা no correlation) দেখতে পাওয়া যায়। এটি দুটি পরিবর্তনশীলের মধ্যে covariance বা correlation বিশ্লেষণে সহায়ক।

বৈশিষ্ট্য:

  • দুইটি বিকল্প পরিবর্তনশীলের মধ্যে সম্পর্ক প্রদর্শন করে।
  • Correlation এবং regression বিশ্লেষণ করতে সাহায্য করে।
  • ডেটার মধ্যে সম্পর্ক বা ট্রেন্ড চিহ্নিত করা যায়।

ব্যবহার:

  • দুটি ভেরিয়েবলের মধ্যে সম্পর্ক বিশ্লেষণ।
  • Linear বা Non-linear সম্পর্ক চিহ্নিত করা।

উদাহরণ:

import matplotlib.pyplot as plt
import numpy as np

# ডেটা তৈরি
x = np.random.rand(50)
y = x + np.random.rand(50)

# Scatter Plot তৈরি
plt.scatter(x, y)
plt.title('Scatter Plot')
plt.xlabel('X-axis')
plt.ylabel('Y-axis')
plt.show()

তুলনা: Box Plot, Histogram, এবং Scatter Plot

ধরনBox PlotHistogramScatter Plot
প্রধান উদ্দেশ্যডেটার বিতরণ, মধ্যম, পার্সেন্টাইল, আউটলিয়ার দেখানোডেটার ফ্রিকোয়েন্সি ডিস্ট্রিবিউশন দেখানোদুটি পরিবর্তনশীলের মধ্যে সম্পর্ক দেখা
ব্যবহারবিতরণ বিশ্লেষণ, আউটলিয়ার চিহ্নিত করাডেটার বন্টন দেখানো, ভ্যারিয়েন্স পরিমাপসম্পর্ক বিশ্লেষণ (covariance, correlation)
চিত্রের ধরনবক্স ও উইস্কার গ্রাফবার বা কলাম গ্রাফপয়েন্ট গ্রাফ (X,Y পয়েন্টস)
প্রধান উপাদানমিনিমাম, ম্যাক্সিমাম, কুয়ার্টাইলস, মিডিয়ানরেঞ্জ (বিন) এবং ফ্রিকোয়েন্সিX এবং Y এর মান

সারাংশ

  • Box Plot: ডেটার সারাংশ এবং আউটলিয়ার চিহ্নিত করতে ব্যবহৃত।
  • Histogram: ডেটার ফ্রিকোয়েন্সি বিশ্লেষণ এবং বন্টন পর্যালোচনা করতে ব্যবহৃত।
  • Scatter Plot: দুটি ভেরিয়েবলের মধ্যে সম্পর্ক চিহ্নিত এবং বিশ্লেষণ করতে ব্যবহৃত।

এই গ্রাফগুলি ডেটা বিশ্লেষণের জন্য গুরুত্বপূর্ণ এবং প্রতিটি ভিজ্যুয়ালাইজেশন নির্দিষ্ট পরিস্থিতিতে উপকারী।

Content added By
Promotion

Are you sure to start over?

Loading...